第 1 版 / 头版
工具狂Draw Things特群日报
工具狂DRAW THINGS特群 DAILY · GROUP DAILY · LOCAL EDITION
23
2026年05月
周六
工具狂Draw Things特群群出版
ISSN G-19385 385 条消息 · 19 人参演 今日 4 版
HEADLINE · 09:08 → 22:37 主线报道
前滚石工程师揭行业底牌:不融合AI就是团灭

一场由AI Agent多模型部署分享引发的行业大倒苦水。前滚石音频工程师的现身说法,揭开了传统创意行业五年价格暴跌十几倍的残酷真相,将群友们的焦虑从“AI会不会压价”推向了“我是不是该去开实体店”。在AI重构商业逻辑的今天,有人开始研究小朋友卖猫毛的情绪经济,有人在深夜死磕多模型并发的显存极限。

CAST@追光行业吹哨人@Sade Harder@VOG转型实干家@佑林@曹贼@iK兎Ki@Jam深夜极客@Sade Harder现实提问者
第 2 版 / 简报
09:08 引子
Agent全智能化的技术诱惑
群聊以追光分享几篇关于LLM底层原理、Agent优化和Draw Things的硬核文章开局。此时,他刚刚在测试中摸透了多台电脑部署不同模型协同工作的门道,抛出了一个极具煽动性的观点:单机操作只是换了个AI工具重复劳动,真正的全智能化应该是人只管思考框架创意。这为后续关于“人机融合”的探讨定下了基调。
追光
「Ai真正的实力应该是全智能化,人只需要思考框架创意,才是本质」
— 追光 · 09:08
11:13 激化
AI压价与行业团灭危机
理想有多丰满,现实就有多骨感。Sade的一句“客户拿AI压价”直接刺破了技术滤镜。追光没有回避,直接亮出底牌:作为前滚石音频工程师,他亲历了行业价格五年暴跌十几倍的惨状。他指出,单纯的手搓时代已经接近团灭,只有将传统行业深度经验与AI融合,变成一个“新物种”,才能在客户那里拿到远超10块钱的价值。这番发言在群里引发了强烈的行业焦虑共鸣。
Sade Harder · 追光
「手搓的优势和ai融合后,是一个新的物种」
— 追光 · 11:13
12:21 转折
退守实体与手工的商业逻辑
面对AI的降维打击,讨论方向从“如何用好AI”转向了“如何避开AI”。VOG坦言拼不过AI,正在找店铺准备做热门手工项目集合(如拼豆)。群友们随即展开了一场关于实体商业自救的讨论:从选址的变迁(不选临街选写字楼靠小红书引流),到外卖平台的抽血效应。在技术洪流中,实体体验和情绪价值反而成了某种避风港。
VOG · 佑林
「现在的餐饮被抖音美团那些吸了不少血,不做大优惠不给推流」
— 佑林 · 12:21
17:29 落地
猫毛经济与人类认知红利
从LTX2.3生成的意识流视频,群聊自然过渡到了对现实意识的探讨。曹贼分享女儿在班上卖猫毛一把五毛,VOG提到一年级同学拿咕卡摆摊,这种看似荒诞的小朋友行为,被群友总结为超越认知的“情绪经济”。大家自嘲赚不到认知以外的钱,在AI时代,人类最后的壁垒或许就是这种与生俱来的商业直觉和动手能力。
曹贼 · iK兎Ki · Sade Harder
「赚不到认知以外的钱」
— Sade Harder · 17:29
22:37 收束
Agent多并发的硬核验证
喧嚣散去,深夜的讨论回归了群名的初衷。Jam在测试Agent时发现LM Studio会自动拉起多个模型实例,追光基于这几天的极限测试给出了结论:Agent需要2-8个模型同时运行,极度依赖显存带宽(单Agent需300GB/s,双线需800GB/s)。他还给出了一个非常落地的模型避坑建议,为这场关于AI替代人类的宏大讨论,画上了一个极具实操意味的句号。
Jam · 追光
「想要真正生产力 必须要高带宽 或者 多个机子 多个模型协同」
— 追光 · 22:37
第 3 版 / 议题与人物
今日议题
Agent多机部署逻辑
单机运行Agent容易触碰带宽和Swap极限,真正生产力需要多台设备部署不同模型协同指挥。
实体手工店降本引流
避开高租金商圈,将体验类实体店开在住宅楼,依靠美团团购和社交媒体引流成为新解法。
人物索引 · CAST
追光 行业吹哨人 用滚石背景和腰斩的报价,撕开AI融合的遮羞布
Sade Harder 现实提问者 用客户压价和AI抢饭碗的现实问题刺破技术滤镜
VOG 转型实干家 果断放弃AI卷生成,转向实体手工店寻找新解法
Jam 深夜极客 实测抓出LMS多实例Bug,验证Agent并发极限
实操干货 · INSIGHTS
本地Agent并发运行的硬件真相
运行Agent进行多线程协同任务时,常常需要2-8个模型同时运行。一台Mac想要支撑单Agent基本需求,显存带宽至少需达到300GB/s;若需双线程正常运行,带宽要求飙升至800GB/s。当物理带宽不足时,系统会疯狂使用Swap,一旦Swap达到极限,Mac的内存管理机制会直接清理内存,导致设备出现类似突然断电的黑屏重启。
— 追光
Agent核心驱动模型格式选择
在LM Studio中运行多线程Agent任务时,应首选GGUF格式而非MLX格式。虽然Qwen3.5-9B的MLX-4bit版本在生成速度上比GGUF的Q4_K_M快约1.7倍,但在推演逻辑、计算和代码执行方面的聪明程度不到GGUF的一半。实测中,GGUF格式的9B模型在操作电脑和推演上的表现甚至优于27B的模型。
— 追光
反直觉的低成本实体店选址策略
当下开设手工体验类实体店,核心商圈临街旺铺不再是必选项。更优的策略是将店铺开在租金低廉的写字楼或住宅楼内,将省下的租金成本用于在小红书、抖音进行线上引流,并开通美团团购让消费者通过搜索主动找上门。
— VOG
第 4 版 / 数据与附录
385
总消息
19
发言者
8608
总字数
5
故事节点
4
高光人物
2
问答
可复用 SOP
如何为本地Agent配置高可用模型
→ 打开 LM Studio,在搜索框中输入并下载 Qwen3.5-9B-Q4_K_M.gguf 模型文件。
→ 确保你的设备显存带宽至少在 300GB/s 以上(如 M系列 Max 或 Ultra 芯片)。
→ 在运行 Agent 任务时,监控内存与 Swap 占用率;若需同时开启 2 个以上模型线程,建议采用多台电脑分布式部署,避免单机内存溢出导致系统崩溃。
→ 坚决弃用 MLX 格式模型,避免在复杂推演和代码执行任务中出现逻辑降智。
群内问答 Q&A
为什么AI先生成图/视频/音乐,而不是先从专业的图像/视频/音频编辑工具出来?
— VOG:闭源模型这些都能做到,dt只是用开源模型的一个玩具而已。其实adobe有在做这个事情,正版的ps就可以用ai工具,只是目前他家用的模型能力不行。
qwen3.5-9B-MLX-4bit 和 Qwen3.5-9B-Q4_K_M.gguf 差很多吗?
— 追光:MLX-4bit比gguf快1.7倍,但聪明程度不到后者的一半。如果纯写字没问题,想要推演和计算、代码执行就必须用后者。
工具狂Draw Things特群 · 2026年05月23日 · 04:35 → 02:16
今日 5 条主线 · 385 条消息 · 19 人参演 · 本地出版
本期完 · 明日续